1.综述
常见的聚类算法可分为三类:
1. 中心探索法:反复迭代计算簇中心的距离,直至在设定的阈值范围内的聚类算法。根据中心的不同定义,又可分为K-Means,K-Medoids,K-Medians及模糊聚类(fuzzy clustering)。
2. 树形构造器:先后合并相互距离比较近的类,使其形成一个较大的类,直到最后只有一个。这种方法即为”阶层式聚类”(agglomerative hierarchical clustering),它最终形成一个树状的类。
3. 邻居生长器:它将彼此”足够接近的”数据点连接在一起形成一个簇,直至所有点都被分类。常用的有DBSCAN,OPTICS及DENCLUE算法。
其中邻居生长器又是一种基于密度的聚类算法(Density-Based Clustering Methods),本博客主要介绍邻居生长器的DBSCAN及OPTICS算法。
2.DBSCAN
2.1 名词定义
- ε 邻域: p 及
q 是数据集中的两个点,点 q 属于点p 的